Philosophie Lexikon der ArgumenteHome | |||
| |||
Verstärkendes Lernen: Verstärkendes Lernen (Reinforcement Learning, RL) ist eine Form des maschinellen Lernens, bei der ein Agent durch Versuch und Irrtum lernt, wie er sich in einer Umgebung verhalten soll. Siehe auch Lernen, Maschinenlernen, Künstliche Intelligenz._____________Anmerkung: Die obigen Begriffscharakterisierungen verstehen sich weder als Definitionen noch als erschöpfende Problemdarstellungen. Sie sollen lediglich den Zugang zu den unten angefügten Quellen erleichtern. - Lexikon der Argumente. | |||
Autor | Begriff | Zusammenfassung/Zitate | Quellen |
---|---|---|---|
Nick Bostrom über Verstärkendes Lernen – Lexikon der Argumente
I 230 Verstärkendes Lernen/Superintelligenz/Werte/Bostrom: Häufig beinhaltet der Lernalgorithmus den schrittweisen Aufbau einer Art Bewertungsfunktion, die Zuständen, Zustands-Aktions-Paaren oder Strategien Werte zuordnet. Problem: Die Evaluationsfunktion, die im Lichte der Erfahrungen ständig aktualisiert wird, könnte als eine Form des Lernens über den Wert angesehen werden. Was jedoch gelernt wird, sind keine neuen endgültigen Werte, sondern zunehmend genaue Schätzungen der instrumentellen Werte des Erreichens bestimmter Zustände (oder des Ergreifens bestimmter Maßnahmen in bestimmten Zuständen). Insofern ein Reinforcement-Learning-Agent so beschrieben werden kann, dass er ein Endziel hat, bleibt dieses Ziel konstant: die zukünftige Belohnung zu maximieren. Und die Belohnung besteht aus speziell bezeichneten Wahrnehmungen, die von der Umwelt erhalten werden. Daher bleibt das Wireheading-Syndrom (Gefangensein in der eigenen Verdrahtung) ein wahrscheinliches Ergebnis bei jedem Verstärkungsagenten, der ein Weltmodell entwickelt, das ausgereift genug ist, um diesen alternativen Weg zur Maximierung der Belohnung vorzuschlagen. >Werte/Superintelligenz/Bostrom._____________ Zeichenerklärung: Römische Ziffern geben die Quelle an, arabische Ziffern die Seitenzahl. Die entsprechenden Titel sind rechts unter Metadaten angegeben. ((s)…): Kommentar des Einsenders. Übersetzungen: Lexikon der ArgumenteDer Hinweis [Begriff/Autor], [Autor1]Vs[Autor2] bzw. [Autor]Vs[Begriff] bzw. "Problem:"/"Lösung", "alt:"/"neu:" und "These:" ist eine Hinzufügung des Lexikons der Argumente. |
Bostrom I Nick Bostrom Superintelligence. Paths, Dangers, Strategies Oxford: Oxford University Press 2017 |